检索结果

Select

1. 面向方面级情感分析的交互式关系图注意力网络

郭磊, 贾真, 李天瑞

《计算机应用》唯一官方网站 2024, 44 (3): 696-701. DOI: 10.11772/j.issn.1001-9081.2023030288

摘要（202）

HTML （22）

PDF （1072KB）（172）

方面级情感分析领域主要采用基于注意力机制的神经网络模型，这类模型忽略了方面词与观点词之间的依存关系和方面词与上下文词之间的距离，导致该类模型情感分类结果不够精确。为了解决上述问题，建立一种交互式关系图注意力网络（RI-GAT）模型。首先，通过长短期记忆（LSTM）网络学习句子的语义特征；然后，将学习的语义特征结合句子的位置信息生成新的特征；最后，在新的特征中提取各方面词和观点词之间的依存关系，实现对句法依存信息和位置信息的高效利用。在Laptop、Restaurant和Twitter数据集上的实验结果表明，相较于次优的动态多通道图卷积网络（DM-GCN），RI-GAT模型分类准确率（Acc）提高了0.67、1.65和1.36个百分点，说明了RI-GAT模型可以更好地建立方面词和意见词之间的联系，使得情感分类更加精确。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 面向源-目的地流的多元时空数据可视分析

周思艺, 李天瑞

《计算机应用》唯一官方网站 2024, 44 (2): 452-459. DOI: 10.11772/j.issn.1001-9081.2023020178

摘要（68）

HTML （3）

PDF （3328KB）（72）

交通智能（IC）卡可以记录居民的移动出行，反映居民的源-目的地（OD）信息；但智能卡记录的OD流数据规模大，直接可视化空间分布容易导致视觉杂乱，并且多元数据类型多，更难以和流数据结合对比分析。首先，针对直接可视化大规模OD数据的空间分布容易视觉遮挡的问题，提出基于正交非负矩阵分解（ONMF）的流聚类方法。所提方法对源-目的地数据聚类后再可视化，可以减少不必要的遮挡。然后，针对多元时空数据类型多难以结合对比分析的问题，设计了公交站点多元时序数据视图。该可视化方法将公交站点的流量大小和空气质量、空气温度、相对湿度、降雨量这四类多元数据在同一时间序列上编码，提高了视图的空间利用率并且可以对比分析。再次，为了辅助用户探索分析，开发了基于OD流和多元数据的交互式可视分析系统，并设计了多种交互操作提升用户探索效率。最后，基于新加坡交通智能卡数据集，从聚类效果和运行时间对该聚类方法评估。结果显示，在用轮廓系数评估聚类效果上，所提方法比原始方法提升了0.028，比用K均值聚类方法提升了0.253；在运行时间上比聚类效果较好的ONMFS（ONMF through Subspace exploration）方法少了254 s。通过案例分析和系统功能对比验证了系统的有效性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

3. 基于伪实体数据增强的高精准率医学领域实体关系抽取

郭安迪, 贾真, 李天瑞

《计算机应用》唯一官方网站 2024, 44 (2): 393-402. DOI: 10.11772/j.issn.1001-9081.2023020143

摘要（185）

HTML （2）

PDF （4228KB）（101）

针对医学领域知识密集、实体抽取和关系分类存在误差传递的问题，提出一种基于伪实体数据增强的高精准率的实体关系抽取框架。首先，在实体抽取模块添加基于Transformer的特征读取单元捕捉类别信息，以在密集的实体中准确识别医学长实体；其次，在流水线抽取框架的基础上插入关系负例生成模块，通过基于欠采样的伪实体生成模型生成混淆关系分类模型的伪实体，并通过三种数据增强生成策略提升模型鉴别主语宾语颠倒、主语宾语边界错误和关系分类错误的能力；最后，通过基于悬浮标记的关系分类模型缓解数据增强带来的训练时间剧增的问题。在CMeIE数据集中，对比了目前主流的4个模型。实体抽取部分相较于次优模型PL-Marker（Packed Levitated Marker），F1值提升了2.26%；实体关系抽取相较于次优模型CBLUE（Chinese Biomedical Language Understanding Evaluation）提出的流水线抽取模型，F1值提升了5.45%，精准率提升了15.62%。实验结果表明使用特征读取单元和伪实体数据增强模块可有效提高抽取的精准率。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

4. 基于自注意力机制与词汇增强的中文医学命名实体识别

罗歆然, 李天瑞, 贾真

《计算机应用》唯一官方网站 2024, 44 (2): 385-392. DOI: 10.11772/j.issn.1001-9081.2023020179

摘要（117）

HTML （9）

PDF （2158KB）（104）

针对中文医学文本实体嵌套导致的单词边界识别困难问题以及现有栅格结构集成词汇特征所面临的语义信息损失严重的情况，提出一种用于中文医学命名实体识别（MNER）的自适应词汇信息增强模型。首先，利用双向长短期记忆（BiLSTM）网络编码字符序列的上下文信息并捕捉较长距离的依赖关系；然后，对字符序列中每个字符的潜在单词信息进行字词对建模，采用自注意力机制实现不同单词之间的内部交互；最后，通过基于双线性注意力机制的词汇适配器将词汇信息集成到文本序列中的每个字符中，有效增强语义信息的同时充分利用单词丰富的边界信息，并抑制相关性低的单词。实验结果表明，所提模型与基于字符的基线模型相比，平均F1值分别提升了1.37~2.38个百分点，并在结合BERT后取得了最优的效果。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

5. 判别多维标度特征学习

唐海涛, 王红军, 李天瑞

《计算机应用》唯一官方网站 2023, 43 (5): 1323-1329. DOI: 10.11772/j.issn.1001-9081.2022030419

摘要（497）

HTML （91）

PDF （1101KB）（439）

传统多维标度方法学习得到的低维嵌入保持了数据点的拓扑结构，但忽略了低维嵌入数据类别间的判别性。基于此，提出一种基于多维标度法的无监督判别性特征学习方法——判别多维标度模型（DMDS），该模型能在学习低维数据表示的同时发现簇结构，并通过使同簇的低维嵌入更接近，让学习到的数据表示更具有判别性。首先，设计了DMDS对应的目标公式，体现所学习特征在保留拓扑性的同时增强判别性；其次，对目标函数进行了推理和求解，并根据推理过程设计所对应的迭代优化算法；最后，在12个公开的数据集上对聚类平均准确率和平均纯度进行对比实验。实验结果表明，根据Friedman统计量综合评价DMDS在12个数据集上的性能优于原始数据表示和传统多维标度模型的数据表示，它的低维嵌入更具有判别性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

6. 基于模糊粗糙集的无监督动态特征选择算法

马磊, 罗川, 李天瑞, 陈红梅

《计算机应用》唯一官方网站 2023, 43 (10): 3121-3128. DOI: 10.11772/j.issn.1001-9081.2022101543

摘要（147）

HTML （9）

PDF （511KB）（91）

动态特征选择算法能够大幅提升处理动态数据的效率，然而目前基于模糊粗糙集的无监督的动态特征选择算法较少。针对上述问题，提出一种特征分批次到达情况下的基于模糊粗糙集的无监督动态特征选择（UDFRFS）算法。首先，通过定义伪三角范数和新的相似关系在已有数据的基础上进行模糊关系值的更新过程，从而减少不必要的运算过程；其次，通过利用已有的特征选择结果，在新的特征到达后，使用依赖度判断原始特征部分是否需要重新计算，以减少冗余的特征选择过程，从而进一步提高特征选择的速度。实验结果表明，UDFRFS相较于静态的基于依赖度的无监督模糊粗糙集特征选择算法，在时间效率方面能够提升90个百分点以上，同时保持较好的分类精度和聚类表现。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

7. 面向通信成本优化的联邦学习算法

郑赛, 李天瑞, 黄维

《计算机应用》唯一官方网站 2023, 43 (1): 1-7. DOI: 10.11772/j.issn.1001-9081.2021122054

摘要（750）

HTML （49）

PDF （1156KB）（473）

联邦学习是一种能够保护数据隐私的机器学习设置，然而高昂的通信成本和客户端的异质性问题阻碍了联邦学习的规模化落地。针对这两个问题，提出一种面向通信成本优化的联邦学习算法。首先，服务器接收来自客户端的生成模型并生成模拟数据；然后，服务器利用模拟数据训练全局模型并将其发送给客户端，客户端利用全局模型进行微调后得到最终模型。所提算法仅需要客户端与服务器之间的一轮通信，并且利用微调客户端模型来解决客户端异质性问题。在客户端数量为20个时，在MNIST和CIFAR?10这两个数据集上进行了实验。结果表明，所提算法能够在保证准确率的前提下，在MNIST数据集上将通信的数据量减少至联邦平均（FedAvg）算法的1/10，在CIFAR-10数据集上将通信数据量减少至FedAvg算法的1/100。

参考文献 | 相关文章 | 多维度评价

Select

8. 基于医疗文本数据聚类的帕金森病早期诊断预测

张晓博, 杨燕, 李天瑞, 陆凡, 彭莉兰

计算机应用 2020, 40 (10): 3088-3094. DOI: 10.11772/j.issn.1001-9081.2020030359

摘要（413）

PDF （1270KB）（826）

针对多发于老龄人群的帕金森病（PD）的早期智能化诊断的问题，提出基于医疗检测文本信息数据的聚类技术来对PD进行分析预测。首先，对原始数据集进行预处理以获取有效特征信息，并通过主成分分析（PCA）方法将原始特征分别降维到8个不同维度的维度空间；然后，应用5个传统的经典聚类模型和3种不同的聚类集成方法分别对8个维度空间的数据进行聚类；最后，采用4个聚类性能指标来预测数据集中的多巴胺异常PD患者、健康体和无多巴胺缺失（SWEDD） PD患者。仿真结果显示，PCA特征维度值取30时，高斯混合模型（GMM）的聚类准确度达到89.12%；PCA特征维度值取70时，谱聚类（SC）的聚类准确度达到61.41%；PCA特征维度值取80时，元聚类算法（MCLA）的聚类准确度达到59.62%。对比实验结果表明，5种经典聚类方法中，PCA的特征维度值小于40时，高斯混合模型聚类效果最佳；3种聚类集成方法中，对于不同的特征维度，MCLA的聚类性能均表现优异，进而为PD的早期智能化辅助诊断提供了技术和理论支撑。

参考文献 | 相关文章 | 多维度评价

Select

9. 基于微操作的Hadoop参数自动调优方法

李耘书, 滕飞, 李天瑞

计算机应用 2019, 39 (6): 1589-1594. DOI: 10.11772/j.issn.1001-9081.2018122592

摘要（387）

PDF （931KB）（250）

Hadoop作为大规模分布式数据处理框架已经在工业界得到广泛的应用，针对手动和经验调优方法中参数空间庞大和运行流程复杂的问题，提出了一种Hadoop参数自动优化的方法和分析框架。首先，对作业运行流程进行解耦，从可变参数直接影响的更细粒度的角度定义微操作，从而分析参数和单次微操作执行时间的关系；然后，利用微操作对作业运行流程进行重构，建立参数和作业运行时间关系的模型；最后，在此模型上应用各类搜索优化算法高效快速得出优化后的系统参数。在terasort和wordcount两个作业类型上进行了实验，实验结果表明，相对于默认参数情况，该方法使作业执行时间分别缩短了至少41%和30%。该方法能够有效提高Hadoop作业执行效率，缩短作业执行时间。

参考文献 | 相关文章 | 多维度评价

Select

10. 带权超网络的度量方法及其性质

刘胜久, 李天瑞, 杨宗霖, 珠杰

计算机应用 2019, 39 (11): 3107-3113. DOI: 10.11772/j.issn.1001-9081.2019050806

摘要（483）

PDF （913KB）（363）

超网络是较通常意义上的复杂网络更为复杂的网络，该网络的每一条超边能连接任意多个节点的特性使其比复杂网络能更好地描述真实世界中的复杂系统。针对现有超网络研究中对超网络度量方法的缺陷与不足，提出了一种超网络度量方法——超网络维数（HD），即为所有超边包含的节点权重之和与对应超边权重乘积和的对数值和节点权重之和与超边权重之和乘积对数值的比值的两倍。超网络维数可以应用于节点权重与超边权重为正实数、负实数、纯虚数，乃至复数等多种不同数值类型的带权超网络中。最后给出了超网络维数的若干性质。

参考文献 | 相关文章 | 多维度评价

Select

11. 基于螺旋图的时间序列数据可视化

杨欢欢, 李天瑞, 陈馨菂

计算机应用 2017, 37 (9): 2443-2448. DOI: 10.11772/j.issn.1001-9081.2017.09.2443

摘要（721）

PDF （914KB）（671）

阶段性时间序列数据是一种生活中常见数据形式，它描述一个包含多个状态转换的事件，每个状态都具有时间属性，且状态之间的转换存在多条路径。针对现有的可视化方法不能有效展示各个状态之间变化以及状态间路径的时间属性信息的问题，提出一个全新的基于螺旋图的可视化模型。该模型使用一个圆环表示一个状态，一个事件的多个状态采用一组同心圆表示，状态间可达路径采用螺旋线表示，螺旋线的起始位置由其起始时间与起始状态圆环决定，终止位置由其结束时间与结束状态圆环决定。针对路径过多导致路径覆盖较为严重的问题，该模型采用基于长尾函数的透明算法，根据一条路径与其他路径的交叉数，为每条路径分配透明度。该模型还提供了路径的筛选、高亮、查看详细信息、缩放等功能，实现了灵活的交互操作。通过对中国铁路列车站点数据进行实验，实验结果表明该模型能够在有限的空间中有效地展示站点间运行任意时长的列车，并且在列车较多的情况下降低了螺旋线交叉重叠带来的杂乱度，同时有效地保留了列车的运行信息，能够为用户路线的选择提供决策支持，说明了该模型对阶段性时间序列数据可视化的有效性。

参考文献 | 相关文章 | 多维度评价

Select

12. 中文异构百科知识库实体对齐

黄峻福, 李天瑞, 贾真, 景运革, 张涛

计算机应用 2016, 36 (7): 1881-1886. DOI: 10.11772/j.issn.1001-9081.2016.07.1881

摘要（936）

PDF （1027KB）（612）

针对传统实体对齐方法在中文异构网络百科实体对齐任务中效果不够显著的问题，提出一种基于实体属性与上下文主题特征相结合的实体对齐方法。首先，基于百度百科及互动百科数据构造中文异构百科知识库，通过统计方法构造资源描述框架模式（RDFS）词表，对实体属性进行规范化；其次，抽取实体上下文信息，对其进行中文分词后，利用主题模型对上下文建模并通过吉布斯采样法求解模型参数，计算出主题-单词概率矩阵，提取特征词集合及对应特征矩阵；然后，利用最长公共子序列（LCS）算法判定实体属性相似度，当相似度位于下界与上界之间时，进一步结合百科类实体上下文主题特征进行判定；最后，依据标准方法构造了一个异构中文百科实体对齐数据集进行仿真实验。实验结果表明，与经典的属性相似度算法、属性加权算法、上下文词频特征模型及主题模型算法进行比较，所提出的实体对齐算法在人物领域和影视领域的准确率、召回率与综合指标F值分别达到97.8%、88.0%、92.6%和98.6%、73.0%、83.9%，比其他方法均有较大的提高。实验结果验证了在构建中文异构百科知识库场景中，所提算法可以有效提升中文百科实体对齐效果，可应用到具有上下文信息的实体对齐任务中。

参考文献 | 相关文章 | 多维度评价

Select

13. 基于计算统一设备架构的高铁故障诊断方法

陈志, 李天瑞, 李明, 杨燕

计算机应用 2015, 35 (10): 2819-2823. DOI: 10.11772/j.issn.1001-9081.2015.10.2819

摘要（409）

PDF （703KB）（407）

为解决传统高铁振动信号故障诊断方法速度慢、难以满足实时处理的要求,提出一种基于计算统一设备架构(CUDA)加速的高铁振动信号故障诊断方法。首先利用CUDA架构对高铁数据进行经验模态分解(EMD),进而计算分解所得到的各个分量的模糊熵,最后利用最近邻分类(KNN)算法对多个模糊熵特征组成的特征空间进行故障分类。实验结果表明,该方法能高效地对高铁振动信号进行故障分类,运行速度较传统方法有明显提高。

参考文献 | 相关文章 | 多维度评价

Select

14. 基于Spark的蚁群优化算法

王诏远, 王宏杰, 邢焕来, 李天瑞

计算机应用 2015, 35 (10): 2777-2780. DOI: 10.11772/j.issn.1001-9081.2015.10.2777

摘要（933）

PDF （721KB）（604）

为应对大数据时代中组合优化问题的求解,基于云计算框架Spark,借助其基于内存、分布式的特定,提出一种并行蚁群优化算法。其思路是通过将蚂蚁构造为弹性分布式数据集,由此给出相应的一系列转换算子,实现了蚂蚁构造解过程的并行化。通过在旅行商问题(TSP)求解的仿真实验结果说明了所提出的并行算法的可行性;并在同等实验环境下对比基于MapReduce的蚁群优化算法,优化速度提升达10倍以上。

参考文献 | 相关文章 | 多维度评价

Select

15. 基于网络效用最大化与冲突避免的无线传感器网络MAC协议

刘韬李天瑞殷锋张楠

计算机应用 2014, 34 (11): 3196-3200. DOI: 10.11772/j.issn.1001-9081.2014.11.3196

摘要（205）

PDF （756KB）（497）

针对周期汇报型无线传感器网络(WSN)中的无线信号冲突和能量利用效率问题,提出了一种基于网络效用最大化与冲突避免的媒体访问控制(UM-MAC)协议。该协议基于时分多路复用(TDMA)调度机制,将效用模型引入无冲突的节点工作时隙分配过程中,把链路可靠性、网络能耗归纳到一个统一的效用优化框架中;进而提出了一个启发式算法,使网络能够快速找到一个基于网络效用最大化与冲突避免的节点工作时隙调度方案。将UM-MAC协议与S-MAC协议和冲突避免MAC(CA-MAC)协议进行比较,在不同节点数量的网络环境中,UM-MAC获得的网络效用较大,平均数据包成功发送率较高,生命周期介于S-MAC与CA-MAC之间,在不同的网络负载下所有节点发数据包到汇聚节点的平均时延有所增加。仿真实验结果表明:UM-MAC协议较好地解决了冲突干扰问题,提高了网络的数据包成功发送率和能量利用效率等性能;在低网络负载时,TDMA类协议的性能并不比竞争类协议好。

参考文献 | 相关文章 | 多维度评价

Select

16. 智慧轨道交通——实现更深入的智能化

杨燕朱焱戴齐李天瑞

计算机应用 2012, 32 (05): 1205-1207.

摘要（1603）

PDF （2286KB）（1175）

当前轨道交通已成为居民出行的重要交通工具之一。智慧轨道交通的核心是要通过现代信息技术以一种更加智慧的方法来改变现有轨道交通方式，为人类社会活动带来更加快捷、安全、舒适的智慧交通系统。讨论了智慧轨道交通中更深入的智能化的四个关键步骤：数据智慧采集、数据智慧融合、数据智慧挖掘和智慧决策。这四个步骤形成一个螺旋上升的智能信息处理过程，最终可以达到智慧轨道交通更深入的智能化目的。

参考文献 | 相关文章 | 多维度评价

Select

17. 基于MR-AAM双重拟合的人脸特征点定位方法

叶超,李天瑞,龚勋

计算机应用 2011, 31 (10): 2724-2727. DOI: 10.3724/SP.J.1087.2011.02724

摘要（1160）

PDF （701KB）（516）

传统的主动表观模型(AAM)反向组合算法仅进行了单次拟合过程,当初始位置与目标对象偏移过大时,往往会陷入局部最小,难以收敛到正确位置。针对此问题,提出了一种基于多分辨率AAM(MR-AAM)的双重拟合方法,首先在低分辨率模型下进行第一次拟合以确定面部初始位置,然后在高分辨率模型下进行二次拟合。由于能够快速获得较准确的初始位置,进而取得较好的人脸特征标定结果。实验结果表明,所提方法与传统方法相比,在能保证实时的情况下,提高了拟合精度。